Národní úložiště šedé literatury Nalezeno 132 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Multi-label klasifikace textových dokumentů
Průša, Petr ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce)
Diplomová práce se zabývá automatickou klasifikací textových dokumentů. Jsou zde vysvětleny základní pojmy a problémy dolování z textu. Práce vysvětluje pojem shlukování a ukazuje několik základních algoritmů shlukování. Je zde ukázáno i několik metod klasifikace a podrobně je rozebrána vybraná metoda matrix regression. Dále byla navrhnuta a implementována aplikace používající ke klasifikaci matrix regression. Provedené experimenty byly zaměřeny na normalizaci a prahování.
Shlukování textových dat
Leixner, Petr ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce)
Proces shlukování textových dat slouží pro analýzu, navigaci a strukturování velkých kolekcí textů nebo hypertextových dokumentů. Úkolem shlukování je rozklad množiny dokumentů do shluků na základě jejich podobnosti. Nejznámější metody z této oblasti dolování však neřeší specifické problémy textového shlukování, jako vysokou dimenzionalitu vstupních dat, velmi velkou velikost databází a srozumitelnost popisu shluků. Tato práce se zabývá uvedenou problematikou a popisuje moderní metodu shlukování textových dat založenou na použití frekventovaných množin termů, která se svým přístupem snaží řešit nedostatky jiných shlukovacích metod.
Algoritmy pro shlukování textových dat
Sedláček, Josef ; Burget, Radim (oponent) ; Karásek, Jan (vedoucí práce)
Tato diplomová práce se zabývá problematikou dolování textových dat. Je zde popsána teorie potřebná ke shlukování textových dokumentů a také algoritmy, které se při shlukování využívají. Podle této teorie je pak vytvořena aplikace pro shlukování textových dat. Aplikace je vytvořena v programovacím jazyku Java a obsahuje tři metody používané při shlukování. Uživatel si tak sám může vybrat metodu, podle které chce kolekci dokumentů shlukovat. Implementované metody jsou K medoids, BiSec K medoids a SOM (self organization map). Součástí aplikace je také vytvoření validační množiny, pomocí které jsou algoritmy testovány. V závěru jsou pak algoritmy porovnány podle dosažených výsledků.
Analýza dat z mikročipů pro zjišťování genové exprese
Hebelka, Tomáš ; Jaša, Petr (oponent) ; Burgetová, Ivana (vedoucí práce)
Práce se zabývá analýzou dat z DNA mikročipů pomocí shlukové analýzy. Vysvětluje biologické pojmy - genová exprese a DNA mikročip. Následně obsahuje matematický a informatický popis metod shlukování a popisuje, jak tyto metody aplikovat na data z mikročipů. Dále práce obsahuje implementační detaily shlukovacích metod k-means, DBSCAN a představuje originální shlukovací algoritmus Strom++. Poté následuje popis implementace a ovládání programu. Na konec jsou zhodnoceny dosažené výsledky.
Detekce a sledování objektů pomocí význačných bodů
Bílý, Vojtěch ; Hradiš, Michal (oponent) ; Juránek, Roman (vedoucí práce)
Tato práce se zabývá detekcí a sledováním objektů  pomocí význačných bodů. Jsou zde popsány existující přístupy k této problematice. Je zde navržená inovovaná metoda detekce objektů založená na Obecné Houghově transformaci a iterativním prohledáváním Houghova prostoru. Na nejrůznějších typech objektu je demonstrována univerzálnost navrženého detektoru. Sledování objektů je řešeno detekcí objektu snímek po snímku.
Unsupervised Evaluation of Speaker Recognition System
Odehnal, Ondřej ; Plchot, Oldřich (oponent) ; Matějka, Pavel (vedoucí práce)
The context of this thesis is the state-of-the-art system for speaker identification (SID) based on the deep nerual network with x-vector embeddings. This thesis aims to propose and experimentally assess several techniques for evaluating the SID system using unlabelled datasets. For this purpose, discriminative embedding is created for every recording in the dataset. These embeddings are used to cluster the recordings and thus create pseudo-labels corresponding to different clusters. The SID system evaluation is based on equal error rate (EER), which uses these pseudo-labels. We proposed several unsupervised learning algorithms to achieve this; K-means, Gaussian mixture models (GMM), and agglomerative hierarchical clustering (AHC). After thorough testing, the K-means model with the Silhouette value showed the best results. This method achieved an estimate of 5.72 % EER with the reference EER equal to 5.15 % on SITW dev-core-core. Similar results were observed on the SITW eval-core-core, where the estimated EER is equal to 5.86 % and the reference 5.08 %. The difference between estimated and reference EER is 0.57 % for the dev-core-core and 0.78 % for the eval-core-core. Another series of experiments were conducted on NIST SRE16 and VoxCeleb1 to verify robustness of the proposed method. Generally, the developed testing process had an estimated error of around 1 % in all test databases, an excellent result for an unsupervised learning technique.
Shlukování biologických sekvencí
Kubiš, Radim ; Burgetová, Ivana (oponent) ; Martínek, Tomáš (vedoucí práce)
Jedním z hlavních důvodů, proč se proteinové sekvence shlukují, je predikce jejich struktury, funkce a evoluce. Mnoho současných nástrojů má nevýhodu ve velké výpočetní náročnosti, protože zarovnává každou sekvenci s každou. Pokud některý nástroj pracuje výrazně rychleji, nedosahuje oproti ostatním takové přesnosti. Další z nevýhod je zpracování na vyšších mírách podobnosti, ale homologní proteiny si mohou být podobné i méně. Proces shlukování také bývá ukončen při dosažení určité podmínky, která však nezohledňuje dostatečnou kvalitu shluků. Diplomová práce se zabývá návrhem a implementací nového nástroje pro shlukování proteinových sekvencí. Nový nástroj by měl být výpočetně nenáročný, se zachováním požadované přesnosti, a produkovat kvalitnější shluky. Práce dále popisuje testování navrženého nástroje, zhodnocení dosažených výsledků a možnosti dalšího rozvoje.
Získávání znalostí z multimediálních databází
Málik, Peter ; Bartík, Vladimír (oponent) ; Chmelař, Petr (vedoucí práce)
Tato diplomová práce se zabývá problematikou získávání znalostí z multimediálních databází. Obsahuje obecný princip získávání znalostí z databází. Důraz je kladen na metody shlukové analýzy pro dolování dat v rozsáhlých a multidimenzionálních databázích. Dále tahle práce obsahuje úvod do multimediálních databází se zaměřením se na extrakci nízkourovňových vizuálních rysů z obrázkú a video dat. Praktickou částí práce je potom implementace metod BIRCH, DBSCAN a k-means určených pro shlukovou analýzu. Závěr je věnován experimentům nad datovou sadou TRECVid 2008 a popisu dosažených výsledků.
Vyhledávání fotografií v databázi podle příkladu
Dobrotka, Matúš ; Hradiš, Michal (oponent) ; Veľas, Martin (vedoucí práce)
Táto práce se zabývá vyhledáváním fotografií v databázi podle příkladu. Práce byla vytvo\-ře\-na s cílem vyvinout aplikaci, která bude porovnávat různé přístupy vyhledávání fotografií v databázi. Jedná se o základní přístup, který spočívá v detekci klíčových bodů, extrakci lokálních příznaků a tvorbě vizuálního slovníku algoritmem shlukování - k-means. Pomocí vizuálního slovníku je spočítán histogram četnosti výskytu vizuálních slov - Bag of Words (BoW), který reprezentuje fotografii jako celek. Po aplikování vhodné metriky dojde k vyhledání podobných fotografií. Druhý přístup představují hluboké konvoluční neuronové sítě (DCNN), které jsou využity k extrakci příznakových vektorů. Tyto vektory jsou použity na tvorbu vizuálního slovníku, který slouží opět k výpočtu BoW. Postup je pak podobný jako v prvním přístupu. Třetí přístup počítá s extrahovanými vektory z DCNN jako s BoW vektory. Následuje aplikace vhodné metriky a vyhledání podobných fotografií. V závěru práce jsou popsány použity přístupy, uvedeny experimenty a závěrečné vyhodnocení.
Získávání znalostí z dat - shlukovací algoritmy
Kapavík, Radim ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce)
Tato práce se zabývá shlukovou analýzou se zaměřením na problémy stanovení nezbytných parametrů shlukování. Její převážná část je věnována popisu implementace metody DENCLUE, založené na hustotě, a návrhu způsobu automatického nastavování jejího klíčového parametru označovaného jako sigma.

Národní úložiště šedé literatury : Nalezeno 132 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.